مدلسازی وابسته به متن در بازشناسی گفتار پیوسته بر اساس در خت تصمیم گیری آوایی فارسی
نویسندگان
چکیده
مدلسازی وابسته به متن به عنوان شیوه ای مفید برای افزایش دقت مدلسازی در بازشناسی گفتار پیوسته مورد توجه است. معمولترین شکل پیاده سازی این شیوه، استفاده از مدلهای سه آوایی است. با این همه، تعداد زیاد این مدلها موجب می شود که در عمل، آموزش سیستم با مشکلات زیادی همراه باشد و دستیابی به آموزش مقاوم (robust training) به سختی میسر گشته یا اصولا مقدور نشود. یکی از شیوه های حل این مشکل، استفاده از روش گره زدن (tying) پارامترها است. در این مقاله خوشه بندی (clustering) برای پارامترهای حالت مدل hmm صورت گرفته و حالتهای قرار گرفته در خوشه با یکدیگر گره زده شده اند تا در کل سیستم، تعداد پارامترها کاهش یافته و آموزش مقاوم حاصل شود. دو نوع دسته بندی یکی بر اساس پارامترهای مدلهای نهایی آموزش دیده و فاصله بین آنها و دیگری به کمک داده های آموزشی و بر مبنای درخت تصمیم گیری انجام شده است. در پیاده سازی روش اخیر به طراحی درخت تصمیم گیری بر اساس ویژگیهای آکوستیکی آواها در زبان فارسی و شباهتها و تفاوتهای آنها اقدام شده است. نتایج بدست آمده، موفقیت آمیز بودن هر دو روش را تایید کرده است. با این حال، مزیت روش دوم در امکانپذیر ساختن تخمین پارامترهای مدلهای دیده نشده است.
منابع مشابه
مدلسازی تنوعات تلفظی آوایی به منظور ایجاد واژگان پویای تطبیقی در سیستم بازشناسی گفتار پیوسته
در این رساله به ارائه روشهایی برای مدلسازی تلفظ در واژگان برای بهبود عملکرد سیستم بازشناسی گفتار پیوسته پرداختیم. تلفظ تحت تاثیر عوامل متعددی از جمله عوامل وابسته به گوینده و مستقل از گوینده می باشد. این عوامل می توانند موضعی و فرا موضعی باشند. بخشی از تحقیق حاضر به بررسی آماری میزان و نحوه تاثیر این عوامل از جمله نرخ بیان، احتمال وقوع کلمه، جایگاه هجا در کلمه، موضع تکیه در کلمه روی تلفظ در گفت...
15 صفحه اولبازشناسی احساس از روی گفتار پیوسته فارسی
در سالهای اخیر بازشناسی احساس به عنوان روش جدیدی برای تعامل انسان با کامپیوتر مورد توجه و موضوع تحقیقات زیادی بوده است. احساس، در قالب حرکات چهره، گفتار، حرکات دست و بدن و علایم زیستی مانند ضربان قلب بروز می یابد. مدل پیشنهادی در این پایان نامه از گفتار پیوسته فارسی برای بازشناسی احساس استفاده می کند. بازشناسی احساس از گفتار بر روی زبان های مختلفی انجام شده اما بر روی زبان فارسی تا کنون این چن...
بازشناسی گفتار پیوسته فارسی به کمک شبکه های عصبی
گفتار محصول سیستمهای تولید و درک گفتار و مغز انسان است . انسان همیشه از طریق گفت و شنود توانسته است ارتباط بهتری با محیط خود برقرار کند. بنابراین اگر بتوان از کامپیوتر بصورت سمعی و بصری بهره گرفت ، تحول بزرگی در استفاده از آنها بوجود می آید. در این پروژه، بمنظور طراحی روشهایی در بازشناخت گفتار پیوسته فارسی، شبکه های عصبی بعنوان ابزار مدلسازی انتخاب شده اند. در بخش نخست اجرای پروژه، با هدف دستیا...
15 صفحه اولبازشناسی گوینده وابسته به متن
دراین تحقیق طراحی و بکارگیری سیستمهای بازشناسی گوینده ارائه شده است. بازشناسی گوینده، استفاده از یک ماشین جهت بازشناسی یک شخص از یک عبارت بیان شده است. این سیستمها می توانند به دو روش عمل کنند : شناسایی یک شخص بخصوص یا تآیید ادعای شخص مدعی، شناسایی یک شخص با استفاده از ویژگیهای فیزیکی از قبیل گفتار، نمونه ای از اهمیت تجاری در زمینه امنیتی است. بازشناسی گفتار یک روش شناسایی شخص، مبتنی بر استخراج...
15 صفحه اولپایهگذاری بستری نو و کارآمد در حوزه بازشناسی گفتار فارسی
Although researches in the field of Persian speech recognition claim a thirty-year-old history in Iran which has achieved considerable progresses, due to the lack of well-defined experimental framework, outcomes from many of these researches are not comparable to each other and their accurate assessment won’t be possible. The experimental framework includes ASR toolkit and speech database ...
متن کاملرتبهبندی واجهای گفتار فارسی از نظر کارآیی در بازشناسی گوینده
در این مقاله، کارآیی واجهای گفتار فارسی از نظر بازشناسی گوینده مورد مطالعه و پژوهش قرار گرفته و با توجه به میزان کارآییها، رتبهبندی واجها صورت گرفتهاند. جهت برآورد کارآیی واجها، از یک معیاری که بهصورت نسب « فاصلة بینگویندهای» واجها به « فاصلة در گویندهای» تعریف شده است و ما آن را « نسبت تأثیرپذیری گوینده » نامیدهایم، استفاده شده است. آزمایشها و محاسبات لازم برای کلیه واجهای گفتار...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
مهندسی برق مدرسجلد ۳، شماره ۱، صفحات ۴۳-۵۶
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023